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Beschreibung 

VERWANDTE ANMELDUNGEN 

[0001] Die vorliegende Anmeldung ist mit der An- 

meldung Nr. _/_, , mit dem Titel "Suspending 

Execution of a Thread in a Multi-threaded Proces- 
sor"; der Anmeldung Nr. _/_, , mit dem Titel "Co- 
herency Techniques for Suspending Execution of a 
Thread Until a Specified Memory Access Occurs"; 

Anmeldung Nr. / , , mit dem Titel "Instruction 

Sequences for Suspending Execution of a Thread 
Until a Specified Memory Access Occurs", verwandt, 
die alle am selben Datum wie die vorliegende Anmel- 
dung registriert wurden. 

HINTERGRUND 1. Technisches Gebiet 

[0002] Die vorliegende Offenlegung betrifft das Ge- 
biet der Prozessoren und insbesondere Mehr- 
fach-Thread-Prozessoren und Techniken zum Voru- 
bergehenden Suspendieren der Verarbeitung eines 
Threads in einem Mehrfach-Thread-Prozessor. 

2. Allgemeiner Stand der Technik 

[0003] Ein Mehrfach-Thread-Prozessor kann 
gleichzeitig mehrere verschiedene Anweisungsse- 
quenzen verarbeiten. Ein Hauptmotivierungsfaktor 
fur die Ausfuhrung mehrerer Anweisungsstrome in 
einem einzigen Prozessor ist die resultierende Ver- 
besserung der Prozessorausnutzung. Uber die Jahre 
haben sich parallele Architekturen entwickelt, es ist 
aber haufig schwierig, genug Parallelitat aus einem 
einzigen Anweisungsstrom zu extrahieren, urn die 
mehrfachen Ausfuhrungseinheiten auszunutzen. 
Durch Prozessoren mit gleichzeitigen Mehr- 
fach-Threads konnen mehrere Anweisungsstrome 
gleichzeitig in den verschiedenen Ausfiihrungsbe- 
triebsmitteln ausgefuhrt werden, um zu versuchen, 
diese Betriebsmittel besser auszunutzen. Mehr- 
fach-Threads konnen besondersfur solche Program- 
me vorteilhaft sein, bei denen es zu Verzogerungen 
hoher Latenz kommt Oder die haufig auf das Eintre- 
ten von Ereignissen warten. Wenn ein Thread darauf 
wartet, dafi eine Task mit hoher Latenz fertig wird, 
oder auf ein bestimmtes Ereignis, kann ein anderer 
Thread verarbeitet werden. 

[0004] Es wurden viele verschiedene Techniken 
vorgeschlagen, um zu steuern, wann ein Prozessor 
zwischen Threads wechselt. Zum Beispiel erkennen 
bestimmte Prozessoren bestimmte Ereignisse mit 
langer Latenz, wie zum Beispiel L2-Cache-Fehlspei- 
cherungen und wechseln als Reaktion auf diese er- 
kannten Ereignisse mit langer Latenz Threads. Ob- 
wohl die Erkennung solcher Ereignisse mit langer La- 
tenz in bestimmten Umstanden effektiv sein kann, er- 
kennt eine solche Ereigniserkennung nur unwahr- 
scheinlich aile Punkte, an denen es effizient sein 



kann, Threads zu wechseln. Insbesondere kann es 
sein, daft das Thread-Wechseln auf Ereignisbasis 
Punkte in einem Programm, an denen Verzogerun- 
gen vom Programmierer beabsichtigt sind, nicht er- 
kennt. 

[0005] Tatsachlich ist haufig der Programmierer am 
besten in der Lage, zu bestimmen, wann es effizient 
ware, Threads zu wechseln, um verschwenderische 
Spin-Wait-Schleifen oder andere Betriebsmittel ver- 
brauchende Verzogerungstechniken zu vermeiden. 
Indem Programmen erlaubt wird, den Thread-Wech- 
sel zu steuern, konnen Programme also effizienter 
operieren. Zu diesem Zweck konnen explizite Pro- 
grammanweisungen vorteilhaft sein, die sich auf die 
Thread-Auswahl auswirken. Zum Beispiel wird in der 
US-Patentanmeldung Nr. 09/489,130, registriert am 
21.1.2000, eine „Pause"-Anweisung beschrieben. 
Durch die Pause-Anweisung kann ein Ausfuh- 
rungs-Thread vorubergehend suspendiert werden, 
bis entweder ein Zahlwert erreicht wird oder bis eine 
Anweisung die Prozessor-Pipeline durchlaufen hat. 
Verschiedene Techniken konnen nutzlich sein, indem 
Programmierern erlaubt wird, die Betriebsmittel eines 
Mehrfach-Thread-Prozessors effizienter einzuspan- 
nen. 

Kurze Beschreibung der Zeichnungen 

[0006] Die vorliegende Erfindung wird in den Figu- 
ren der beigefugten Zeichnungen als Beispiel und 
nicht als Beschrankung veranschaulicht. 

[0007] Fig. 1 zeigt eine Ausfuhrungsform eines 
Mehrfach-Thread-Prozessors mit einer Uberwa- 
chungsvorrichtung zum Uberwachen von Speicher- 
zugriffen. 

[0008] Fig. 2 ist ein Fluftdiagramm der Funktions- 
weise des Mehrfach-Thread-Prozessors von Fig. 1 
gemafc einer Ausfuhrungsform. 

[0009] Fig. 3 zeigt weitere Einzelheiten einer Aus- 
fuhrungsform eines Mehrfach-Thread-Prozessors. 

[0010] Fig. 4 zeigt Betriebsmittel-Partitionie- 
rung-Sharing und -Duplikation gemali einer Ausfuh- 
rungsform. 

[0011] Fig. 5 ist ein Fluftdiagramm des Suspendie- 
rens und Wiederaufnehmens der Ausfuhrung eines 
Threads gemaB einer Ausfuhrungsform. 

[0012] Fig. 6a ist ein Flulidiagramm der Aktivierung 
und Funktionsweise von Uberwachungslogik gemafc 
einer Ausfuhrungsform. 

[0013] Fig. 6b ist ein FluBdiagramm der Erweite- 
rung der Beobachtbarkeit von Schreiboperationen 
gemali einer Ausfuhrungsform. 
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[0014] Fig. 7 ist ein FluRdiagramm von Oberwa- 
chungsoperationen gemafc einer Ausfuhrungsform. 

[001 5] Fig. 8 zeigt ein System gemafi einer Ausfuh- 
rungsform. 

[0016] Fig. 9a-9c zeigen verschiedene Ausfuh- 
rungsformen von Softwaresequenzen, die offenge- 
legte Prozessoranweisungen und -techniken verwen- 
den. 

[0017] Fig. 10 zeigt eine alternative Ausfuhrungs- 
form, die es ermoglicht, daft eine uberwachte Adres- 
se Cache-gespeichert bleibt. 

[0018] Fig. 11 zeigt die verschiedenen Entwurfsre- 
prasentationen Oder -formate zur Simulation, Emula- 
tion und Herstellung eines Entwurfs unter Verwen- 
dung der offengelegten Techniken. 

Ausfuhriiche Beschreibung 

[0019] Die folgende Beschreibung beschreibt Tech- 
niken zum Suspendieren der Ausfuhrung eines 
Threads bis ein spezifizierter Speicherzugriff auftritt. 
In der folgenden Beschreibung werden zahlreiche 
spezifische Einzelheiten, wie zum Beispiel iogische 
Implementierungen, Opcodes, Mittel zum Spezifizie- 
ren von Operanden, Implementierungen fur Betriebs- 
mittel-Partitionierung/-Sharing/-Duplikation, Typen 
und Beziehungen von Systemkomponenten und 
Wahlmoglichkeiten fur Iogische Partitionierung/lnte- 
gration dargelegt, um ein besseres Verstandnis der 
vorliegenden Erfindung zu ermoglichen. Fur Fachleu- 
te ist jedoch erkennbar, dafc die Erfindung ohne sol- 
che speziflschen Einzelheiten ausgeiibt werden 
kann. In anderen Fallen wurden Steuerstrukturen, 
Schaltung auf Gatterebene und voile Softwareanwei- 
sungssequenzen nicht im Einzelnen gezeigt, um die 
Erfindung nicht zu verdecken. Anhand der angege- 
benen Beschreibungen werden Durchschnittsfach- 
leute in der Lage sein, ohne ubermafiiges Experi- 
mentieren geeignete Funktionalitat zu implementie- 
ren. 

[0020] Durch die ofFengelegten Techniken kann ein 
Programmierer einen Wartemechanismus in einem 
Thread implementieren, wahrend andere Threads 
Verarbeitungsbetriebsmittel einspannen konnen. Es 
kann eine Oberwachungsvorrichtung eingerichtet 
werden, so daft ein Thread suspendiert werden kann, 
bis ein bestimmter Speicherzugriff, wie zum Beispiel 
eine Schreiboperation in eine spezifizierte Speicher- 
stelle auftritt. Somit kann ein Thread bei einem spezi- 
fizierten Ereignis wiederaufgenommen werden, ohne 
eine prozessorbetriebsmittelverschwendende Routi- 
ne wie etwa eine Spin-Wait-Schleife auszufuhren. 
Bei bestimmten Ausfuhrungsformen konnen zuvor 
dem suspendierten Thread zugeordnete Partitionen 
freigegeben werden, wahrend der Thread suspen- 



diert ist. Diese und/oder andere offengelegte Techni- 
ken konnen vorteilhafterweise den Gesamtprozess- 
ordurchsatz verbessern. 

[0021] Fig. 1 zeigt eine Ausfuhrungsform eines 
Mehrfach-Thread-Prozessors 100 mit einer Spei- 
cherzugriffuberwachungsvorrichtung 110 zur Uber- 
wachung von Speicherzugriffen. Bei bestimmten 
Ausfuhrungsformen kann ein „Prozessor" als eine 
einzige integrierte Schaltung gebildet werden. Bei 
anderen Ausfuhrungsformen konnen mehrere inte- 
grierte Schaltungen zusammen einen Prozessor bil- 
den, und bei noch anderen Ausfuhrungsformen kon- 
nen Hardware- und Softwareroutinen (z.B. binare 
Ubersetzungsroutinen) zusammen den Prozessor 
bilden. Bei der Ausfuhrungsform von Fig. 1 fuhrt eine 
Bus-/Speichersteuerung 120 einem Frontend 130 
auszufuhrende Anweisungen zu. Das Frontend 130 
lenkt das Abrufen von Anweisungen von verschiede- 
nen Threads gemafc Anweisungszeigem 170. Anwei- 
sungszeigerlogik ist vervielfaltigt, um mehrere 
Threads zu unterstutzen. 

[0022] Das Frontend 130 leitet Anweisungen in 
Thread-partitionierbare Betriebsmittel 140 zurweite- 
ren Verarbeitung. Die Thread-partitionierbaren Be- 
triebsmittel 140 enthalten logisch getrennte Partitio- 
nen, die fest bestimmten Threads zugeordnet sind, 
wenn mehrere Threads in dem Prozessor 100 aktiv 
sind. Bei einer Ausfuhrungsform enthalt jede ge- 
trennte Partition nur Anweisungen aus dem Thread, 
dem dieser Teil feist zugeordnet ist. Die Thread-parti- 
tionierbaren Betriebsmittel 140 konnen zum Beispiel 
Anweisungswarteschlangen enthalten. In einem Ein- 
zel-Thread-Modus konnen die Partitionen der 
Thread-partitionierbaren Betriebsmittel 140 kombi- 
niert werden, um eine einzige grofce Partition zu bil- 
den, die dem einen Thread fest zugeordnet ist. 

[0023] Aufierdem enthalt der Prozessor 100 den 
vervielfaltigten Zustand 180. Der vervielfaltigte Zu- 
stand 180 enthalt Zustandsvariablen, die ausreichen, 
um den Kontext fur einen logischen Prozessor zu hal- 
ten. Mit dem vervielfaltigten Zustand 180 konnen 
mehrere Threads ausgefuhrt werden, ohne um Zu- 
standsvariablenspeicherung zu konkurrieren. Zu- 
satzlich kann fur jeden Thread Registerzuteilungslo- 
gik vervielfaltigt sein. Die vervielfaltigte zustandsbe- 
zogene Logik operiert mit den entsprechenden Be- 
triebsmittelpartitionen, um ankommende Anweisun- 
gen fur die Ausfuhrung vorzubereiten. 

[0024] Die Thread-partitionierbaren Betriebsmittel 
140 leiten Anweisungen zu gemeinsam benutzten 
Betriebsmitteln 150 weiter. Die gemeinsam benutz- 
ten Betriebsmittel 150 operieren an Anweisungen un- 
geachtet ihres Ursprungs. Zum Beispiel konnen 
Scheduler- und Ausfuhrungseinheiten Thread-unbe- 
wufite gemeinsam benutzte Betriebsmittel sein. Die 
partitionierbaren Betriebsmittel 140 konnen den ge- 
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meinsam benutzten Betriebsmitteln 150 Anweisun- 
gen aus mehreren Threads zufuhren, indem zwi- 
schen den Threads auf eine faire Weise alterniert 
wird, die einen fortgesetzten Fortschritt an jedem ak- 
tiven Thread bereitstellt. Somit konnen die gemein- 
sam benutzten Betriebsmittel die bereitgestellten An- 
weisungen an dem entsprechenden Zustand ohne 
Sorge um die Thread-Mischung ausfuhren. 

[0025] Den gemeinsam benutzten Betriebsmitteln 
150 kann eine weitere Menge von Thread-partitio- 
nierbaren Betriebsmitteln 160 folgen. Die Thread- 
partitionierbaren Betriebsmittel 160 konnen Aus- 
scheidungsbetriebsmittel wie zum Beispiel ein Um- 
ordnungspuffer und dergleichen enthalten. Folglich 
konnen die Thread-partitionierbaren Betriebsmittel 
1 60 sicherstellen, dafi die Ausfuhrung von Anweisun- 
gen aus jedem Thread ordnungsgemaB endet, und 
dafi der entsprechende Zustand fur diesen Thread 
entsprechend aktualisiert wird. 

[0026] Wie bereits erwahnt, kann es wunschens- 
wert sein, Programmierern eine Technik zur Imple- 
mentierung der Funktionalitat einer Spin-Wait-Schlei- 
fe bereitzustellen, ohne ein konstantes Abfragen ei- 
ner Speicherstelle oder sogar Ausfuhren von Anwei- 
sungen zu erfordern. Somit enthalt der Prozessor 
100 von Fig. 1 die Speicherzugriffsuberwachungs- 
vorrichtung 110. Die Speicherzugriffsuberwachungs- 
vorrichtung 110 kann mit Informationen uber einen 
Speicherzugriffszyklus programmiert werden, fur 
dessen Beobachtung die Oberwachungsvorrichtung 
110 freigegeben werden kann. Folglich enthalt die 
Oberwachungsvorrichtung 110 ein Oberwachungs- 
vorrichtungszyklusinformationsregister 112, das 
durch Vergleichslogik 114 mit aus der Bus-/Speicher- 
steuerung 120 empfangenen Buszyklusinformatio- 
nen verglichen wird. Wenn es zu einer Obereinstim- 
mung kommt, wird ein Thread-Wiederaufnehmen-Si- 
gnal erzeugt, um einen suspendierten Thread neu zu 
starten. Aus internen und/oder extemen Bussen des 
Prozessors konnen Speicherzugriffsinformationen 
erhalten werden. 

[0027] Das Oberwachungsvorrichtungszyklusinfor- 
mationsregister 112 kann Einzelheiten enthalten, die 
die Art des Zyklus und/oder die Adresse, die die Wie- 
deraufnahme eines Threads auslosen sollte, spezifi- 
zieren. Bei einer Ausfuhrungsform speichert das 
Uberwachungsvorrichtungszyklusinformationsregis- 
ter 112 eine physikalische Adresse und die Oberwa- 
chungsvorrichtung wartet auf jegliche Buszyklen, die 
ein tatsachliches oder potentielles Schreiben in diese 
physikalische Adresse anzeigen. Ein solcher Zyklus 
kann in Form eines expliziten Schreibzyklus vorlie- 
gen und/oder kann eine Leseoperation fur Eigentu- 
merschaft oder ein invalidierender Zyklus durch ei- 
nen anderen Agenten sein, der versucht, die exklusi- 
ve Eigentumerschaft einer Cache-speicherbaren Lei- 
tung zu ubernehmen, so daft er ohne eine externe 



Bustransaktion auf diese Leitung schreiben kann. In 
jedem Fall kann die Oberwachungsvorrichtung so 
programmiert werden, daft sie bei verschiedenen 
Ausfuhrungsformen an verschiedenen Transaktio- 
nen ausgelost wird. 

[0028] Die Operationen der Ausfuhrungsform von 
Fig. 1 konnen mit Bezug auf das FlufkJiagramm von 
Fig. 2 weiter erlautert werden. Bei einer Ausfuh- 
rungsform enthalt der Anweisungssatz des Prozes- 
sors 100 einen MONITOR-Opcode (Anweisung), der 
die Oberwachungstransaktionsinformationen einrich- 
tet. Im Block 200 wird der MONITOR-Opcode als Teil 
der Anweisungssequenz eines ersten Threads (T1) 
empfangen. Wie im Block 210 angegeben, ermog- 
licht es der Prozessor 100 als Reaktion auf den MO- 
NITOR-Opcode der Oberwachungsvorrichtung 110, 
Speicherzugriffe fur den spezifizierten Speicherzu- 
griff zu uberwachen. Der auslosende Speicherzugriff 
kann durch einen impliziten oder einen expliziten 
Operanden spezifiziert werden. Deshalb kann das 
Ausfuhren des MONITOR-Opcodes die Uberwa- 
chungsadresse spezifizieren, da die Oberwachungs- 
adresse im Voraus in einem Register oder in einer 
anderen Speicherstelle als ein impliziter Operand ge- 
speichert werden kann. Wie im Block 215 angege- 
ben, pruft die Oberwachungsvorrichtung, ob der spe- 
zifizierte Zyklus erkannt wurde. Wenn nicht, uber- 
wacht die Oberwachungsvorrichtung weiter Spei- 
cherzugriffe. Wenn der auslosende Zyklus erkannt 
wird, wird ein Anstehendes-Oberwachungsereig- 
nis-Anzeiger gesetzt, wie im Block 220 angegeben. 

[0029] Die Ausfuhrung des MONITOR-Opcodes 
lost die Aktivierung der Oberwachungsvorrichtung 
110 aus. Die Oberwachungsvorrichtung 110 kann be- 
ginnen, parallel mit anderen Operationen in dem Pro- 
zessor zu operieren. Bei einer Ausfuhrungsform rich- 
tet die MONITOR-Anweisung selbst nur die Oberwa- 
chungsvorrichtung 110 mit den ordnungsgemafien 
Speicherzyklusinformationen ein und aktiviert die 
Oberwachungsvorrichtung 110, ohne Uberwa- 
chungsereignisse zu entmaskieren. Anders ausge- 
driickt, konnen sich bei dieser Ausfuhrungsform nach 
der Ausfuhrung des MONITOR-Opcodes Oberwa- 
chungsereignisse ansammeln, was jedoch unerkannt 
bleiben kann, wenn sie nicht explizit entmaskiert wer- 
den. 

[0030] Im Block 225 wird also das Auslosen eines 
Speicherwartens als ein separates Ereignis angege- 
ben. Bei bestimmten Ausfuhrungsformen kann ein 
Opcode fur Speicherwarten (M WAIT) verwendet wer- 
den, um die Erkennung von Oberwachungsereignis- 
sen und die Suspendierung von T1 auszulosen. 
Durch die Verwendung zweier getrennter Anweisun- 
gen zum Einrichten und zum Auslosen der 
Thread-Suspendierung kann ein Programmierer zu- 
satzliche Flexibility erhalten und es kann ein effizien- 
teres Programmieren moglich werden. Eine alternati- 
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ve Ausfuhrungsform lost das Speicherwarten jedoch 
von dem ersten Opcode aus, der auch die Oberwa- 
chungsvorrichtung 110 einrichtet. In jedem Fall akti- 
vieren eine oder mehrere Anweisungen die Oberwa- 
chungsvorrichtung und ermoglichen das Erkennen 
von Oberwachungsereignissen. 

[0031] Bei Ausfuhrungsformen, bei denen getrennte 
Opcodes zum Aktivieren der Oberwachungsvorrich- 
tung 110 und zum Auslosen des Erkennens von 
Oberwachungsereignissen verwendet werden, kann 
es vorteilhaft sein, eine Prufung durchzufuhren, um 
sicherzustellen, daft die Oberwachungsvorrichtung 
aktiviert worden ist, bevor der Thread suspendiert 
wird, wie im Block 230 gezeigt. Durch Prufen, ob ein 
Oberwachungsereignis bereits ansteht (nicht ge- 
zeigt) kann zusatzlich die Suspendierung von T1 ver- 
mieden werden und die Operationen konnen im 
Block 250 fortgesetzt werden. Unter der Annahme, 
daft die Oberwachungsvorrichtung 110 freigegeben 
wurde und keine Qberwachungsereignisse bereits 
anstehen, kann T1 suspendiert werden, wie im Block 
235 gezeigt. 

[0032] Mit suspendiertem T1 tritt der Prozessor in 
einen implementierungsabhangigen Zustand ein, der 
es anderen Threads ermoglicht, die Prozessorbe- 
triebsmittel besser auszunutzen. Bei bestimmten 
Ausfuhrungsformen kann der Prozessor einen Teil 
der Partitionen der partitionierbaren Betriebsmittel 
140 und 160, die fest T1 zugeordnet waren, oder alle 
diese freigeben. Bei anderen Ausfuhrungsformen 
konnen verschiedene Permutationen des MONI- 
TOR-Opcodes oder von diesem zugeordneten Ein- 
stellungen angeben, welche etwaigen Betriebsmittel 
freigegeben werden. Wenn zum Beispiel ein Pro- 
grammierer ein kurzeres Warten antizipiert, kann der 
Thread suspendiert werden, aber seine Betriebsmit- 
telpartitionen aufrechterhalten. Der Durchsatz ist im- 
mer noch verbessert, da die gemeinsam benutzten 
Betriebsmittel wahrend des Thread-Suspendierungs- 
zeitraums ausschlieftlich von anderen Threads ver- 
wendet werden konnen. Wenn ein langeres Warten 
antizipiert wird, konnen durch Freigabe aller dem 
suspendierten Thread zugeordneten Partitionen an- 
dere Threads zusatzliche Betriebsmittel erhalten, wo- 
durch der Durchsatz der anderen Threads potentiell 
erhoht wird. Der zusatzliche Durchsatz wird jedoch 
zu Lasten des Overheads erhalten, das dem Entfer- 
nen und Hinzufugen von Partitionen, wenn Threads 
suspendiert bzw. wiederaufgenommen werden, zu- 
geordnet ist. 

[0033] T1 bleibt in einem suspendierten Zustand, 
bis ein Oberwachungsereignis ansteht. Wie bereits 
besprochen, operiert die Oberwachungsvorrichtung 
110 unabhangig, um Qberwachungsereignisse zu er- 
kennen und zu signalisieren (Blocke 215-220). Wenn 
der Prozessor im Block 240 erkennt, daft ein Oberwa- 
chungsereignis ansteht, wird T1 wiederaufgenom- 



men, wie im Block 250 angegeben. Es muft keine ak- 
tive Verarbeitung von Anweisungen in T1 auftreten, 
damit das Oberwachungsereignis T1 aufweckt. Statt 
dessen bleibt T1 suspendiert und die freigegebene 
Oberwachungsvorrichtung 110 signalisiert dem Pro- 
zessor ein Ereignis. Der Prozessor wickelt das Ereig- 
nis ab, erkennt, daft das Ereignis anzeigt, daft T1 
wiederaufgenommen werden soil, und fuhrt die ent- 
sprechenden Aktionen zur Wiederaufnahme von T1 
durch. 

[0034] Die Ausfuhrungsformen von Fig. 1 und 2 lie- 
fern also Techniken, durch die ein durch ein Pro- 
gramm suspendierter Thread nach dem Auftreten ei- 
nes spezifizierten Speicherzugriffs wiederaufgenom- 
men werden kann. Bei einer Ausfuhrungsform bewir- 
ken auch andere Ereignisse, daft 71 wiederaufge- 
nommen wird. Zum Beispiel kann ein Interrupt bewir- 
ken, daft T1 wiederaufgenommen wird. Durch eine 
solche Implementierung ist es vorteilhafterweise 
moglich, daft die Oberwachungsvorrichtung insofern 
weniger a!s perfekt ist, als sie bestimmte Speicherzu- 
griffe oder andere Bedingungen, die eine Wiederauf- 
nahme des Threads verursachen sollten, verfehlt 
(nicht erkennt). Folglich kann T1 manchmal unnoti- 
gerweise aufgeweckt werden. Eine solche Imple- 
mentierung verringert jedoch die Wahrscheinlichkeit, 
daftTI aufgrund eines verfehlten Ereignisses perma- 
nent eingefroren wird, wodurch Hardwareentwurf und 
-validierung vereinfacht werden. Die unnotigen Erwe- 
ckungen von T1 konnen nur eine geringfugige Unan- 
nehmlichkeit sein, da eine Schleife konstruiert wer- 
den kann, so daft T1 nachpruft, ob die Bedingung, die 
er erwartet hat, wirklich aufgetreten ist, und. er sich 
nochmals selbst suspendieren kann, wenn dies nicht 
der Fall ist. 

[0035] Bei bestimmten Ausfuhrungsformen konnen 
die Thread-partitionierbaren Betriebsmittel, die ver- 
vielfaltigten Betriebsmittel und die gemeinsam be- 
nutzten Betriebsmittel verschieden angeordnet sein. 
Bei bestimmten Ausfuhrungsformen liegen mogli- 
cherweise nicht an beiden Enden der gemeinsam be- 
nutzten Betriebsmittel partitionierbare Betriebsmittel 
vor. Bei bestimmten Ausfuhrungsformen konnen die 
partitionierbaren Betriebsmittel moglicherweise nicht 
strikt partitioniert sein, sondem statt dessen be- 
stimmten Anweisungen ermoglichen, Partitionen zu 
uberschreiten, oder Partitionen ermoglichen, ieine 
verschiedene Grofte aufzuweisen, abhangig von 
dem in dieser Partition ausgefuhrten Thread oder von 
der Gesamtzahl von ausgefuhrten Threads. Aufter- 
dem konnen verschiedene Mischungen von Betriebs- 
mitteln als gemeinsam benutzte, duplizierte und par- 
titionierte Betriebsmittel ausgewiesen werden. 

[0036] Fig. 3 zeigt weitere Einzelheiten einer Aus- 
fuhrungsform eines Mehrfach-Thread-Prozessors. 
Die Ausfuhrungsform von Fig. 3 enthalt unter ande- 
rem mit Koharenz zusammenhangende Logik 350, 
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eine Implementierung einer Uberwachungsvorrich- 
tung 310 und eine spezifische Implementierung von 
Thread-Suspendierungs- und -wiederaufnahmelogik 
377. Bei der Ausfiihrungsform von Fig. 3 enthalt eine 
Busschnittstelle 300 eine Bussteuerung 340, Ereig- 
niserkennungslogik 345, eine Uberwachungsvorrich- 
tung 310 und die mit Koharenz zusammenhangende 
Logik 350. 

[0037] Die Busschnittstelle 300 fiihrt einem Fron- 
tend 365 Anweisungen zu, das die Erzeugung von 
Mikrooperanden (uOP) durchfuhrt und aus Makroan- 
weisungen uOPs erzeugt. Die Ausfuhrungsbetriebs- 
mittel 370 empfangen uOPS von dem Frontend 365, 
und Backend-Logik 380 zieht die verschiedenen 
uOPs zuruck, nachdem sie ausgefuhrt wurden. Bei 
einer Ausfuhrungsform unterstutzen das Frontend, 
das Backend und Ausfuhrungsbetriebsmittel eine 
Ausfuhrung aufierhalb der Reihenfolge. 

[0038] Mit Bezug auf Fig. 5-9 werden verschiedene 
Einzelheiten von Operationen weiter besprochen. 
Kurz gefafct kann jedoch ein MONITOR-Opcode 
durch die Busschnittstelle 300 in den Prozessor ein- 
treten und durch das Frontend 365 fur die Ausfuh- 
rung vorbereitet werden. Bei einer Ausfuhrungsform 
wird zur Ausfuhrung durch die Ausfuhrungsbetriebs- 
mittel 370 ein spezieller MONITOR-uOP erzeugt. Der 
MONITOR-uOP kann von den Ausfuhrungseinheiten 
ahnlich wie eine Speicheroperation behandelt wer- 
den, wobei die Uberwachungsadresse durch Adres- 
senubersetzungslogik 375 in eine physikalische 
Adresse ubersetzt wird, die der Oberwachungsvor- 
richtung 310 zugefuhrt wird. Die Oberwachungsvor- 
richtung 310 kommuniziert mit Thread-Suspendie- 
rungs- und -wiederaufnahmelogik 377, um die Wie- 
deraufnahme von Threads zu bewirken. Die 
Thread-Suspendierungs- und -wiederaufnahmelogik 
kann Partition und Verschmelzung von Betriebsmit- 
teln durchfuhren, wenn sich die Anzahl aktiver 
Threads andert. 

[0039] Zum Beispiel zeigt Fig. 4 das Partitionieren, 
Duplizieren und gemeinsame Benutzen von Be- 
triebsmitteln gemafl einer Ausfuhrungsform. Partitio- 
nierte Betriebsmittel konnen gemafc dem Auf und Ab 
aktiver Threads in der Maschine partitioniert und ver- 
schmolzen (zur Wiederverwendung durch andere 
Threads wieder zusammengeschmolzen) werden. 
Bei der Ausfuhrungsform von Fig. 4 umfassen dupli- 
zierte Betriebsmittel Anweisungszeigerlogik in dem 
Anweisungsabrufteil der Pipeline, Registerumbenen- 
nungslogik in dem Umbenennungsteil der Pipeline, 
(nicht gezeigte, aber in verschiedenen Stufen in der 
Pipeline erwahnte) Zustandsvariablen und eine Inter- 
rupt-Steuerung (nicht gezeigt, im allgemeinen asyn- 
chron zur Pipeline). Gemeinsam benutzte Betriebs- 
mittel in der Ausfuhrungsform von Fig. 4 umfassen 
Scheduler in derSchedule-Stufe der Pipeline, ein Re- 
gisterpool in den Register-Lese- und -schreibteilen 



der Pipeline und Ausfuhrungsbetriebsmittel im Aus- 
fuhrungsteil der Pipeline. Zusatzlich konnen ein Tra- 
ce-Cache und ein L1-Daten-Cache gemeinsam be- 
nutzte Betriebsmittel sein, die gemali Speicherzugrif- 
fen ungeachtet des Thread-Kontexts aufgefullt wer- 
den. Bei anderen Ausfuhrungsformen kann bei Ca- 
che-Speicherungsentscheidungen Thread-Kontext 
berucksichtigt werden. Partitionierte Betriebsmittel in 
der Ausfuhrungsform von Fig. 4 umfassen zwei War- 
teschlangen in Warteschlangenstufen der Pipeline, 
einen Umordnungspuffer in einer Ausscheidungsstu- 
fe der Pipeline und einen Speicherpuffer. 
Thread-Auswahlmultiplexlogik alterniert zwischen 
den verschiedenen duplizierten und partitionierten 
Betriebsmitteln, um beiden Threads einen sinnvollen 
Zugriff zu gewahren. 

[0040] Als Beispiel wird angenommen, daft bei der 
weiteren Beschreibung der Funktionsweise einer 
Ausfuhrungsform des Prozessors von Fig. 3, das in 
Fig. 4 gezeigte Partitionieren, gemeinsame Benut- 
zen und Duplizieren in Verbindung mit der Ausfuh- 
rungsform von Fig. 3 verwendet wird. Insbesondere 
werden nun weitere Einzelheiten der Funktionsweise 
der Ausfuhrungsform von Fig. 3 mit Bezug auf das 
FlulkJiagramm von Fig. 5 besprochen. Es wird ange- 
nommen, dafc der Prozessor in einem Mehr- 
fach-Thread-Modus arbeitet, wobei mindestens zwei 
Threads aktiv sind. 

[0041] Im Block 500 empfangt das Frontend 365 ei- 
nen MONITOR-Opcode wahrend der Ausfuhrung ei- 
nes ersten Threads (T1). Das Frontend 365 erzeugt 
bei einer Ausfuhrungsform einen speziellen Clberwa- 
chungs-uOP. Der MONITOR-uOP wird zu den Aus- 
fuhrungsbetriebsmitteln 370 weitergeleitet. Der Ober- 
wachungs-uOP weist eine zugeordnete Adresse auf, 
die die zu tiberwachende Adresse angibt (die Ober- 
wachungsadresse). Die zugeordnete Adresse kann 
in Form eines expliziten Operanden Oder eines impli- 
ziten Operanden vorliegen (d.h. die zugeordnete 
Adresse ist einem vorbestimmten Register oder einer 
anderen Speicherstelle zu entnehmen). Durch die 
zugeordnete Adresse wird insofem die Uberwa- 
chungsadresse „angegeben", als sie genug Informa- 
tionen zur Bestimmung der Oberwachungsadresse 
(moglicherweise in Verbindung mit anderen Regis- 
tern oder Informationen) ubermittelt. Zum Beispiel 
kann die zugeordnete Adresse eine lineare Adresse 
sein, die eine entsprechende physikalische Adresse 
aufweist, die die fragliche Oberwachungsadresse ist. 
Alternativ dazu konnte die Uberwachungsadresse in 
einem virtuellen Adressenformat gegeben oder als 
eine relative Adresse angegeben oder auf andere be- 
kannte oder zweckmaliige Adressenspezifizierungs- 
weisen spezifiziert werden. Wenn virtuelle Adressen- 
operanden verwendet werden, kann es wunschens- 
wert sein, wenn allgemeine Programmfehler als 
Break-Ereignisse erkannt werden. 
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[0042] Die Oberwachungsadresse kann jede belie- 
bige zweckmaflige Speichereinheit fur die Oberwa- 
chung angeben. Zum Beispiel kann die Oberwa- 
chungsadresse bei einer Ausfuhrungsform eine Ca- 
che-Leitung angeben. Bei alternativen Ausfuhrungs- 
formen kann die Oberwachungsadresse jedoch ei- 
nen Teil einer Cache-Leitung, einen Teil einer spezifi- 
schen gewahlten GroBe Oder eine Einheit von Spei- 
cher mit verschiedenen Beziehungen zu den Ca- 
che-Leitungsgroflen verschiedener Prozessoren 
oder eine einzige Adresse angeben. Die Oberwa- 
chungsadresse kann also eine Einheit angeben, die 
durch den Operanden spezifizierte Daten (und weite- 
re Daten) enthalt, oder kann spezifisch eine Adresse 
fur eine gewunschte Dateneinheit angeben. 

[0043] Bei der Ausfuhrungsform von Fig. 3 wird die 
Oberwachungsadresse der Adressenubersetzungs- 
logik 375 zugefuhrt und zu der Oberwachungsvor- 
richtung 31 0 weitergeleitet und dort in einem Oberwa- 
chungsadressenregister 335 gespeichert. Als Reakti- 
on auf den MONITOR-Opcode wird die Oberwa- 
chungsvorrichtung 310 dann durch die Ausfuhrungs- 
betriebsmittel 370 freigegeben und aktiviert, wie im 
Block 510 angegeben und in Fig. 6 weiter erlautert. 
Wie spater mit Bezug auf Fig. 6 weiter besprochen 
werden wird, kann es vorteilhaft sein, etwaige Spei- 
cheroperationen, die nach dem MONITOR-Opcode 
auftreten, einzusperren, um sicherzustellen, dad 
Speicheroperationen verarbeitet und deshalb er- 
kannt werden, bevor jegliche Thread-Suspendierung 
auftritt. Es mussen moglicherweise also bei dieser 
Ausfuhrungsform als Ergebnis des Aktivierens der 
Oberwachungsvorrichtung 310 bestimmte Operatio- 
nen auftreten, bevor jegliche nachfolgende Anwei- 
sungen unternommen werden konnen. Der Block 
510 ist jedoch als parallel zu dem Block 505 auftre- 
tend gezeigt, weil bei dieser Ausfuhrungsform die 
Oberwachungsvorrichtung 310 weiter parallel mit an- 
deren Operationen operiert, bis ein Break-Ereignis 
auftritt, nachdem sie durch den MONITOR-Opcode 
aktiviert wurde. 

[0044] Im Block 505 wird in Thread 1 ein Opcode fur 
Speicherwarten (MWAIT) empfangen und zur Aus- 
fuhrung weitergeleitet. Die Ausfiihrung des 
MWAIT-Opcodes entmaskiert Oberwachungsereig- 
nisse in der Ausfuhrungsform von Fig. 5. Als Reakti- 
on auf den MWAIT-Opcode wird wie im Block 515 an- 
gegeben gepruft, ob ein Oberwachungsereignis an- 
steht Wenn kein Oberwachungsereignis ansteht, 
wird im Block 520 eine Prufung durchgefuhrt, um si- 
cherzustellen, daft die Oberwachungsvorrichtung ak- 
tiv ist. Wenn zum Beispiel ein MWAIT ausgefuhrt 
wird, ohne daft zuvor ein MONITOR ausgefuhrt wur- 
de, ware die Oberwachungsvorrichtung 310 nicht ak- 
tiv. Wenn entweder die Oberwachungsvorrichtung in- 
aktiv ist oder ein Oberwachungsereignis ansteht, wird 
die Ausfuhrung von Thread 1 im Block 580 fortge- 
setzt 



[0045] Wenn die Oberwachungsvorrichtung 310 ak- 
tiv ist und kein Oberwachungsereignis ansteht, dann 
wird die Ausfuhrung von Thread 1 suspendiert, wie 
im Block 525 angegeben. Die Thread-Suspendie- 
rungs-/-wiederaufnahmelogik 377 enthalt Pipe- 
line-Flush-Logik 382, die die Prozessorpipeline ent- 
leert, um alie Anweisungen auszuraumen, wie im 
Block 530 angegeben. 

[0046] Nachdem die Pipeline entleert wurde, be- 
wirkt die Partitions-A/erschmelzungslogik 385, daft 
jegliche exklusiv Thread 1 zugeordnete Betriebsmit- 
tel zur Verwendung durch andere Threads freigege- 
ben werden, wie im Block 535 angegeben. Diese frei- 
gegebenen Betriebsmittel werden verschmolzen, um 
zur Benutzung durch die ubrigen aktiven Threads 
eine Menge grofcerer Betriebsmittel zu bilden. Zum 
Beispiel werden mit Bezug auf das Zweithreadbei- 
spiel von Fig. 4 alle mit Thread 1 zusammenhangen- 
den Anweisungen aus beiden Warteschlangen ent- 
leert. Jedes Paarvon Warteschlange wird dann kom- 
biniert, um dem zweiten Thread eine groftere Warte- 
schlange bereitzustellen. Ahnlich werden dem zwei- 
ten Thread weitere Register aus dem Registerpool 
zur Verfugung gestellt, weitere Eintrage aus dem 
Speicherpuffer werden fur den zweiten Thread befreit 
und weitere Eintrage in dem Umordnungspuffer wer- 
den dem zweiten Thread zur Verfugung gestellt. Im 
wesentlichen werden diese Strukturen wieder in ein- 
zelne festzugeordnete Strukturen der doppelten Gro- 
fie verwandelt. Naturlich konnen sich verschiedene 
Proportionen aus Implementierungen ergeben, die 
verschieden viele Threads verwenden. 

[0047] In den Blocken 540, 545 und 550 werden 
verschiedene Ereignisse gepruft, um zu bestimmen, 
ob Thread 1 wieder aufgenommen werden soil. Es ist 
zu beachten, dali diese Prufungen nicht durch An- 
weisungen durchgefuhrt werden, die als Teil von 
Thread 1 ausgefuhrt werden. Statt dessen werden 
diese Operationen durch den Prozessor parallel mit 
seiner Verarbeitung anderer Threads durchgefuhrt. 
Wie ausfuhrlicher mit Bezug auf Fig. 6 besprochen 
werden wird, pruft die Oberwachungsvorrichtung 
selbst, ob ein Oberwachungs-Schreibereignis aufge- 
treten ist, und zeigt dies durch Setzen eines Anste- 
hendes-Ereignis-Anzeigers an. Der Anstehendes-Er- 
eignis-Anzeiger wird uber eine EVENT-Signal der 
Suspendierungs-/Wiederaufnahmelogik 377 zuge- 
fuhrt (z.B. Mikrocode). Mikrocode kann bei einer Aus- 
fuhrungsform das Oberwachungsereignis an einer 
entsprechenden Anweisungsgrenze erkennen (Block 
540), da dieses Ereignis im Block 505 durch den 
MWAIT-Opcode entmaskiert wurde. Die Ereignisde- 
tektionslogik 345 kann andere Ereignisse erkennen, 
wie zum Beispiel Interrupts, die als Break-Ereignisse 
ausgewiesen sind (Block 545). Zusatzlich kann ein 
optionaler Timer verwendet werden, um periodisch 
aus dem Speicherwartezustand auszutreten, um si- 
cherzustellen, dali der Prozessor nicht aufgrund ei- 
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ner bestimmten Ereignissequenz einfriert (Block 
550). Wenn keine dieser Ereignisse einen Austritt fur 
den Speicherwartezustand signalisieren, bleibt 
Thread 1 suspend iert. 

[0048] Wenn Thread 1 wieder aufgenommen wird, 
wird die Thread-/Suspendierungswiederaufnahmelo- 
gik 377 nach Erkennung des entsprechenden Ereig- 
nisses nochmals aktiviert. Wieder wird die Pipeline 
ausgeraumt, wie im Block 560 angegeben, urn An- 
weisungen aus der Pipeline zu entleeren, so dalS Be- 
triebsmittel nochmals partitioniert werden konnen, 
urn den bald aufzuweckenden Thread 1 zu beruck- 
sichtigen. Im Block 570 werden die entsprechenden 
Betriebsmittel neu partitioniert und Thread 1 wird im 
Block 580 wiederaufgenommen. 

[0049] Fig. 6a zeigt weitere Einzelheiten der Akti- 
vierung und Funktionsweise der Uberwachungsvor- 
richtung 310. Im Block 600 wird das Frontend-Abru- 
fen fur Thread 1 gestoppt, urn zu verhindern, dafc 
weitere Operationen von Thread 1 in die Maschine 
eintreten. Im Block 605 wird der zugeordnete Adres- 
senoperand durch die Adressenubersetzungslogik 
375 von einer linearen Adresse in eine physikalische 
Adresse umgesetzt. Im Block 610 wird die Beobacht- 
barkeit von Schreiboperationen an die uberwachte 
Adresse erhoht. Im allgemeinen besteht das Ziel die- 
ser Operation darin, Cache-Agenten dazu zu zwin- 
gen, Schreib-Operationen, die sich auf an der Ober- 
wachungsadresse gespeicherte Informationen aus- 
wirken wurden, der Oberwachungsvorrichtung 310 
selbst sichtbar zu machen. Weitere Einzelheiten ei- 
ner spezifischen Implementierung werden mit Bezug 
auf Fig. 6b besprochen. Im Block 615 wird die physi- 
kalische Adresse zur Uberwachung gespeichert, ob- 
wohl zu beachten ist, dali diese Adresse fruher oder 
spater in dieser Sequenz gespeichert werden kann. 

[0050] Wie im Block 620 angegeben, wird als 
nachstes die Oberwachungsvorrichtung freigegeben. 
Die Oberwachungsvorrichtung uberwacht Buszyklen 
auf Schreiboperationen in die physikalische Adresse, 
die die in dem Oberwachungsadressenregister 335 
gespeicherte Uberwachungsadresse ist. Weitere 
Einzelheiten der Uberwachungsoperation werden 
nachfolgend mit Bezug auf Fig. 7 besprochen. Nach- 
dem die Oberwachungsvorrichtung freigegeben wur- 
de, wird wie im Block 625 angegeben eine Speicher- 
einsperroperation ausgefuhrt. Das Speichereinsper- 
ren hilftdabei, sicherzustellen, dali alie Speicherope- 
rationen in der Maschine dann verarbeitet werden, 
wenn der MONITOR-Opcode mit der Ausfuhrung fer- 
tig ist. Wenn alle Speicheroperationen aus der Zeit, 
bevor MONITOR aus der Maschine entleert wird, ist 
die Wahrscheinlichkeit, dali falschlich in einen Spei- 
cherwartezustand eingetreten wird, reduziert. Die 
Speichereinsperroperation ist jedoch eine Vorsichts- 
rnafcnahme und kann eine zeitaufwendige Operation 
sein. 



[0051] Dieses Speichereinsperren ist optional, weil 
der MONITOR/MWAIT-Mechanismus dieser Ausfuh- 
rungsform als Mehrfachaustrittsmechanismus aus- 
gelegt wurde. Anders ausgedruckt, konnen auch ver- 
schiedene Ereignisse, wie zum Beispiel bestimmte 
Interrupts, System- oder Onboard-Timer usw. einen 
Austritt aus dem Speicherwartezustand verursachen. 
Es ist also bei dieser Ausfuhrungsform nicht garan- 
tiert, dafl der einzige Grund fur ein Aufwecken des 
Threads darin besteht, dad sich der uberwachte Da- 
tenwert verandert hat. Folglich (siehe auch 
Fig. 9a-c) sollte bei dieser Implementierung Softwa- 
re nachprufen, ob sich der in dem Speicher gespei- 
cherte bestimmte Wert verandert hat. Bei einer Aus- 
fuhrungsform sind bestimmte Ereignisse, darunter 
das Setzen von INTR-, NMI- und SMI-Interrupts; Ma- 
schinenpruf-lnterrupts und Fehler Break-Ereignisse 
und andere, wie zum Beispiel Powerdown-Ereignis- 
se, sind es nicht. Bei einer Ausfuhrungsform ist das 
Setzen des A20M-Anschlusses auch ein Break-Er- 
eignis. 

[0052] Wie im Block 630 gezeigt, priift die Oberwa- 
chungsvorrichtung weiter, ob auftretende Buszyklen 
eine Schreiboperation in die Oberwachungsoperation 
anzeigen oder anzuzeigen scheinen. Wenn ein sol- 
cher Buszyklus erkannt wird, wird der Anstehen- 
des-Ereignis-Anzeiger gesetzt, wie im Block 635 an- 
gegeben. Nach der Ausfuhrung des MWAIT-Op- 
codes (Block 505, Fig. 5) wird dieser Anstehen- 
des-Ereignis-Anzeiger als ein Ereignis versorgt und 
bewirkt Threadwiederaufnahme in den Blocken 
560-580 von Fig. 5. AuBerdem konnen Ereignisse, 
die die Adressenubersetzung verandern, bewirken, 
daU Thread 1 wiederaufgenommen wird. Zum Bei- 
spiel konnen Ereignisse, die bewirken, daU ein Ober- 
setzungs-Look-Aside-Puffer ausgeraumt wird, die 
Wiederaufnahme von Thread 1 auslosen, da die 
Obersetzung, die vorgenommen wurde, um die Uber- 
wachungsadresse aus einer linearen zu einer physi- 
kalischen Adresse zu erzeugen, moglicherweise 
nicht mehr gultig ist. Zum Beispiel konnen in einem 
mit der x86-lntel-Architektur kompatiblen Prozessor 
Schreiboperationen in die Steuerregister CR0, CR3 
und CR4 sowie in bestimmte maschinenspezifische 
Register einen Austritt des Speicherwartezustands 
verursachen. 

[0053] Wie bereits erwahnt, zeigt Fig. 6b weitere 
Einzelheiten der Erweiterung der Beobachtbarkeit 
von Schreiboperationen in die Qberwachungsadres- 
se (Block 610, Fig. 6a). Bei einer Ausfuhrungsform 
raumt der Prozessor die der Oberwachungsadresse 
zugeordnete Cache-Leitung aus alien internen Ca- 
ches des Prozessors aus, wie im Block 650 angege- 
ben. Als Folge dieses Ausraumens erreicht jede 
nachfolgende Schreiboperation in die Oberwa- 
chungsadresse die Busschnittstelle 300, wodurch 
eine Erkennung durch die Oberwachungsvorrichtung 
310, die in der Busschnittstelle 300 enthalten ist, 
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moglich wird. Bei einer Ausfuhrungsform wird der 
MONITOR-uOP nach einer Cache-Lei tungs-Ausra- 
um-CLFLUSH-Anweisung, die eine existierende An- 
weisung in einem x86-Anweisungssatz ist, modelliert 
bzw. hat dasselbe Fehlermodell. Der Oberwa- 
chungs-uOP schreitet durch linear-zu-physika- 
lisch-Obersetzung der Adresse und Ausraumen inter- 
ner Caches sehr ahnlich wie ein CLFLUSH voran; die 
Busschnittstelle erkennt jedoch den Unterschied zwi- 
schen MONITOR und CLFLUSH und behandelt den 
MONITOR-uOP entsprechend. 

[0054] Wie im Block 655 angegeben, aktiviert als 
nachstes die mit Koharenz zusammenhangende Lo- 
gik 350 in der Busschnittstelle 300 die Leseleitungs- 
erzeugungslogik 355, urn eine Leseleitungstransakti- 
on.auf dem Prozessorbus zu erzeugen. Die Leselei- 
tungstransaktion in die Oberwachungsadresse stellt 
sicher, dafi keine anderen Caches in Prozessoren 
auf dem Bus Daten entweder in einem gemeinsam 
benutzten oder exklusiven Zustand (entsprechend 
dem wohlbekannten MESI-Protokoll) an der Oberwa- 
chungsadresse speichern. Bei anderen Protokollen 
konnen andere Zustande verwendet werden; die 
Transaktion ist jedoch dafur ausgelegt, die Wahr- 
scheinlichkeit zu verringern, dali ein anderer Agent in 
die Oberwachungsadresse schreiben kann, ohne 
dafi die Transaktion durch die Oberwachungsvorrich- 
tung 310 beobachtbar ist. Anders ausgedriickt, wer- 
den Schreiboperationen oder Schreiben-anzeigende 
Transaktionen nachfolgend rundgesendet, so dafi sie 
durch die Oberwachungsvorrichtung erkannt werden 
konnen. Nachdem die Leseleitungsoperation fertig 
ist, beginntdie Oberwachungsvorrichtung 310 mit der 
Oberwachung von Transaktionen auf dem Bus. 

[0055] Wahrend zusatzliche Transaktionen auf dem 
Bus auftreten, bewahrt die mit Koharenz zusammen- 
hangende Logik weiter die Beobachtbarkeit der 
Oberwachungsadresse, indem versucht wird, zu ver- 
hindern, dali Busagenten die Eigentumerschaft der 
der uberwachten Adresse zugeordneten Cache-Lei- 
tung ubernehmen. Gemafi einem Busprotokoll kann 
dies dadurch erreicht werden, dafi die Treffererzeu- 
gungslogik 360 wahrend einer SnooprPhase jeder 
Leseoperation der Oberwachungsadresse ein 
HIT#-Signal setzt, wie im Block 660 angegeben. Das 
Setzen von HIT# verhindert, dafi sich andere Caches 
uber den gemeinsam benutzten Zustand hinaus in 
dem MESI-Protokoll zu dem Exklusiv- und dann po- 
tentiell zu dem Modifiziert-Zustand bewegen. Wie im 
Block 665 angegeben, konnen folglich keine Agenten 
in dem gewahlten Koharenzbereich (der Speicherteil, 
der koharent gehalten wird) Daten in dem Modifiziert- 
oder Exklusiv-Zustand (oder ihren Aquivalenten) auf- 
weisen. Der Prozessor scheint effektiv die Ca- 
che-Leitung der Oberwachungsadresse Cache-ge- 
speichert zu haben, obwohl sie bei dieser Ausfuh- 
rungsform aus internen Caches ausgeraumt wurde. 



[0056] Nunmehr mit Bezug auf Fig. 7 sind weitere 
Einzelheiten der dem Block 620 in Fig. 6a zugeord- 
neten Operationen aufgefuhrt. Insbesondere zeigt 
Fig. 7 weitere Einzelheiten der Funktionsweise der 
Oberwachungsvorrichtung 310. Im Block 700 emp- 
fangt die Oberwachungsvorrichtung^ 310 Anforde- 
rungs- und Adresseninformationen aus einer Bus- 
steuerung 340 fur eine Bustransaktion. Wie im Block 
710 angegeben, untersucht die Oberwachungsvor- 
richtung 310 den Buszyklustyp und die betroffene(n) 
Adresse(n). Insbesondere bestimmt die Zyklusver- 
gleichslogik 320, ob der Buszyklus ein spezifizierter 
Zyklus ist. Bei einer Ausfuhrungsform vergleicht eine 
Adressenvergleichsschaltung 330 die Bustransakti- 
onsadresse mit der in dem Uberwachungsadressen- 
register 335 gespeicherten Oberwachungsadresse 
und Schreibdetektionslogik 325 decodiert die Zyklu- 
stypinformationen aus der Bussteuerung 340, um zu 
erkennen, ob eine Schreiboperation aufgetreten ist. 
Wenn eine Schreiboperation in die Oberwachungsa- 
dresse auftritt, wird ein Anstehendes-Ereignis-Anzei- 
ger gesetzt, wie im Block 720 angegeben. Der 
Threadsuspendierungs-/-wiederaufnahmelogik 377 
wird ein Signal (WRITE DETECTED) zugefuhrt, um 
das Ereignis zu signalisieren (und es wird unter der 
Annahme versorgt, dafi sie durch Ausfuhren von 
MWAIT freigegeben wurde). Als letztes wird die 
Oberwachungsvorrichtung 310 angehalten, wie im 
Block 730 angegeben. Das Anhalten der Oberwa- 
chungsvorrichtung spart Strom, ist aber nicht kritisch, 
solange falsche Uberwachungsereignisse maskiert 
oderanderweitig nicht erzeugt werden. Auch kann an 
diesem Punkt der Oberwachungsereignisanzeiger 
zuruckgesetzt werden. In der Regel maskiert das 
Versorgen des Oberwachungsereignisses aufierdem 
die Erkennung weiterer Oberwachungsereignisse, 
bis MWAIT nochmals ausgefuhrt wird. 

[0057] Im Fall einer Leseoperation auf die Oberwa- 
chungsadresse wird die mit Koharenz zusammen- 
hangende Logik 350 aktiviert. Wie im Block 740 an- 
gegeben, wird ein Signal (wie zum Beispiel HIT#) ge- 
setzt, um zu verhindern, dafi ein anderer Agent Ei- 
gentumerschaft erhalt, die zukunftige Schreiboperati- 
onen ohne Koharenzrundsendungen erlauben wur- 
de. Die Oberwachungsvorrichtung 310 bleibt aktiv 
und kehrt danach zum Block 700 zuruck und wird 
nicht durch eine Leseoperation der Oberwachungsa- 
dresse beeinflufit. Wenn eine Transaktion wedereine 
Leseoperation noch eine Schreiboperation in die 
Oberwachungsadresse ist, bleibt die Oberwachungs- 
vorrichtung zusatzlich aktiv und kehrt zum Block 700 
zuruck. 

[0058] Bei bestimmten Ausfuhrungsformen wird die 
MONITOR-Anweisung so begrenzt, dafi nur be- 
stimmte Arten von Zugriffen uberwacht werden kon- 
nen. Diese Zugriffe konnen Zugriffe sein, die als effi- 
ziente Programmiertechniken anzeigend gewahlt 
werden, oder konnen aus anderen GKinden gewahlt 
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werden. Zum Beispiel muft bei einer Ausfuhrungs- 
form der Speicherzugriff eine cachebare Speichero- 
peration in dem Ruckschreibespeicher sein, die na- 
turgernaft ausgerichtet ist. Ein naturgemaft ausge- 
richtetes Element ist ein N-Bitelement, das an einer 
durch N teilbaren Adresse startet. Als Folge der Ver- 
wendung naturgemaft ausgerichteter Elemente muft 
auf eine einzige Cache-Leitung zugegriffen werden 
(statt auf zwei Cache-Leitungen, so wie es notwendig 
ware, falls Daten uber zwei Cache-Leitungen verteilt 
werden), um in die uberwachte Adresse zu schrei- 
ben. Folglich kann die Verwendung naturgemaft aus- 
gerichteter Speicheradressen das Beobachten des 
Busses vereinfachen. 

[0059] Fig. 8 zeigt eine Ausfuhrungsform eines 
Systems, die Mehrfach-Thread-Speicher-Wartetech- 
niken verwendet. Bei der Ausfuhrungsform von 
Fig. 8 ist eine Menge von N Mehrfach-Thread-Pro- 
zessoren (Prozessoren 805-1 bis 805-N) an einen 
Bus 802 angekoppelt. Bei anderen Ausfuhrungsfor- 
men kann ein einziger Prozessoroder eine Mischung 
von Mehrfach-Thread-Prozessoren und Ein- 
zel-Thread-Prozessoren verwendet werden. Zusatz- 
lich konnen andere bekannte oder anderweitige ver- 
fugbare Systemanordnungen verwendet werden. 
Zum Beispiel konnen die Prozessoren in einem 
Punkt-zu-Punkt-Verfahren verbunden werden, und 
Teile wie zum Beispiel die Speicherschnittstelle kon- 
nen in jeden Prozessor integriert sein. 

[0060] Bei der Ausfuhrungsform von Fig. 8 ist eine 
an den Bus angekoppelte Speicherschnittstelle 815 
an einen Speicher 830 und eine Medienschnittstelle 
angekoppelt. Der Speicher 830 enthalt ein fur Mehr- 
fach-Verarbeitung bereites Betriebssystem 835 und 
Anweisungen fur einen ersten Thread 840 und An- 
weisungen fur einen zweiten Thread 845. Die Anwei- 
sungen 830 enthalten gemaft den offengelegten 
Techniken, von denen verschiedene Versionen in 
Fig. 9a-9c gezeigt sind, eine Leerlaufschleife. 

[0061] Die entsprechende Software zur Durchfuh- 
rung dieser verschiedenen Funktionen kann in einem 
beliebigen einer Vielfalt maschinenlesbarer Medien 
bereitgestellt werden. Die Medienschnittstelle 820 
liefert eine Schnittstelle zu solcher Software. Die Me- 
dienschnittstelle 820 kann eine Schnittstelle zu ei- 
nem Speichermedium (z.B. einem Plattenlaufwerk, 
einem optischen Laufwerk, einem Bandlaufwerk, ei- 
nem fluchtigen Speicher, einem nichtfiuchtigen Spei- 
cher oder dergleichen) oder zu einem Obertragungs- 
medium (z.B. einer Netzwerkschnittstelle oder einer 
anderen digitalen oder analogen Kommunikations- 
schnittstelle) sein. Die Medienschnittstelle 820 kann 
Softwareroutinen aus einem Medium (z.B. dem Spei- 
chermedium 792 oder dem Obertragungsmedium 
795) lesen. Maschinenlesbare Medien sind Medien, 
die Informationen zumindest voriibergehend zum Le- 
sen durch eine Maschinenschnittstelle speichern 



konnen. Dazu konnen Signalubertragungen gehoren 
(uber Draht, Optik oder Luft als Medium) und/oder 
physikalische Speichermedien 792, wie zum Beispiel 
verschiedene Arten von Laufwerk- und Speicherge- 
raten. 

[0062] Fig. 9a zeigt eine Leerlaufschleife gemaft ei- 
ner Ausfuhrungsform. Im Block 905 wird der MONI- 
TOR-Befehl mit Adresse 1 als seinem Operanden 
(der Uberwachungsadresse) ausgefuhrt. Im Block 
910 wird der MWAIT-Befehl in demselben Thread 
ausgefuhrt. Wie bereits besprochen, bewirkt die 
MWAIT-Anweisung, daft der Thread suspendiert 
wird, vorausgesetzt, daft andere Bedingungen ord- 
nungsgemaft erfullt sind. Wenn im Block 915 ein 
Break-Ereignis auftritt, geht die Routine zum Block 
920 weiter, um zu bestimmen, ob sich der an der 
Uberwachungsadresse gespeicherte Wert geandert 
hat. Wenn sich der Wert an der Uberwachungsadres- 
se geandert hat, dann wird die Ausfuhrung des 
Threads fortgesetzt, wie im Block 922 angegeben. 
Wenn sich der Wert nicht geandert hat, dann ist ein 
falsches Weckereignis aufgetreten. Das Weckereig- 
nis ist insofern falsch, als aus MWAIT ausgetreten 
wurde, ohne daft eine Speicherschreiboperation in 
die Uberwachungsadresse stattgefunden hat. Wenn 
sich der Wert nicht verandert hat, kehrt die Schleife 
zum Block 905 zuruck, indem die Uberwachungsvor- 
richtung nochmals eingerichtet wird. Durch diese 
Schleifensoftwareimplementierung wird es moglich, 
die Uberwachungsvorrichtung so auszulegen, daft 
falsche Weckereignisse zugelassen werden. 

[0063] Fig. 9b zeigt eine alternative Leerlaufschlei- 
fe. Die Ausfuhrungsform von Fig. 9b fugt eine zusatz- 
liche Prufung hinzu, um die Wahrscheinlichkeit, daft 
die MWAIT-Anweisung eine Schreiboperation in die 
uberwachte Speicheradresse nicht erfaftt, weiter zu 
reduzieren. Wieder beginnt der Flu& in Fig. 9b mit 
der Ausfuhrung der MONITOR-Anweisung mit Adres- 
se 1 als ihrem Operanden, wie im Block 925 angege- 
ben. Zusatzlich liest die Softwareroutine im Block 930 
den Speicherwert an der Oberwachungsadresse. Im 
Block 935 fuhrt die Software eine Nachprufung durch, 
um sicherzustellen, daft sich der Speicherwert nicht 
von dem Wert geandert hat, wodurch angezeigt wird, 
daft der Thread in Leerlauf versetzt werden sollte. 
Wenn sich der Wert geandert hat, wird die Threa- 
dausfuhrung fortgesetzt, wie im Block 952 angege- 
ben. Wenn sich der Wert nicht geandert hat, wird 
MWAIT-Anweisung ausgefuhrt, wie im Block 940 an- 
gegeben. Wie bereits besprochen, wird der Thread 
suspendiert, bis ein Break-Ereignis auftritt (Block 
945). Da falsche Break-Ereignisse zugelassen wer- 
den, wird jedoch im Block 950 nochmals gepruft, ob 
sich der Wert geandert hat. Wenn sich der Wert nicht 
geandert hat, kehrt die Schleife zuruck, um nochmals 
die Uberwachungsvorrichtung freizugeben, Adresse 
1 zu verfolgen, indem zu Block 925 zuriickgekehrt 
wird. Wenn sich der Wert geandert hat, wird die Aus- 



10/30 



DE 102 97 596 T5 2004.12.02 



fuhrung des Threads im Block 952 fortgesetzt. Bei 
bestimmten Ausfuhrungsformen muft die MONI- 
TOR-Anweisung nach einem falschen Weckereignis 
nicht noch mal ausgefuhrt werden, bevor die 
MWAIT-Anweisung ausgefuhrt wird, urn den Thread 
nochmals zu suspendieren. 

[0064] Fig. 9c zeigt ein weiteres Beispiel fur eine 
Softwaresequenz, die MONITOR- und MWAIT-An- 
weisungen verwendet. In dem Beispiel von Fig. 9c 
lauft die Schleife nur dann leer, wenn zwei getrennte 
Tasks in demselben Thread nichts zu tun haben. An 
der Arbeitsspeicherstelle WL1 wird ein konstanter 
Wert CV1 gespeichert, wenn eine erste Routine Ar- 
beit zu leisten hat. Ahnlich wird in WL2 ein zweiter 
konstanter Wert CV2 gespeichert, wenn eine zweite 
Routine Arbeit zu leisten hat. Um eine einzige Uber- 
wachungsadresse zu verwenden, werden WL1 und 
WL2 als Speicherstellen in derselben Cache-Leitung 
gewahlt. Als Alternative kann auch eine einzige Ar- 
beitsspeicherstelle verwendet werden, um Statusan- 
zeiger fur mehrere Tasks zu speichern. Zum Beispiel 
konnen ein Oder mehrere Bits in einem einzigen Byte 
Oder in einer anderen Einheit jeweils eine verschiede- 
ne Tasks reprasentieren. 

[0065] Wie im Block 955 angegeben, wird die Uber- 
wachungseinrichtung dafur eingerichtet, WL1 zu 
uberwachen. Im Block 960 wird gepruft, ob WL1 den 
konstanten Wert speichert, wodurch angezeigt wird, 
daft Arbeit zu verrichten ist. Wenn dies der Fall ist, 
wird die WL1 betreffende Arbeit durchgefuhrt, wie im 
Block 965 angegeben. Wenn nicht, wird im Block 970 
gepruft, ob WL2 CV2 speichert, wodurch angezeigt 
wird, daft Arbeit im Zusammenhang WL2 zu verrich- 
ten ist. Wenn dies der Fall ist, wird die mit WL2 zu- 
sammenhangende Arbeit verrichtet, wie im Block 975 
angegeben. Wenn nicht, kann die Schleife dann be- 
stimmen, ob es angemessen ist, einen Strom verwal- 
tungs-Handler aufzurufen (Block 980). Wenn zum 
Beispiel ein gewahlter Zeitraum abgelaufen ist, kann 
der logische Prozessor in einen Zustand mit verrin- 
gerter Stromaufnahme versetzt werden (z.B. in einen 
einer Menge „C M -Zustanden, die unter der Advanced 
Configuration and Power Interface (ACPI) Specifica- 
tion, Version 1.0b (oder spater), veroffentlicht am 
8.2.1999, erhaltlich bei www.acpi.info zum Zeitpunkt 
der Registration der vorliegenden Anmeldurig defi- 
niert werden). Wenn dies der Fall ist, wird im Block 
$85 der Stromverwaltungs-Handler aufgerufen. In je- 
dem der Falle 965, 975 und 985, in denen Arbeit zu 
verrichten war, verrichtet der Thread diese Arbeit und 
kehrt dann in einer Sphleife zuruck, um dieselben Be- 
stimmungen nach der Einrichtung der Oberwa- 
chungsvorrichtung im Block 955 vorzunehmen. Bei 
einer alternativen Ausfuhrungsform konnte die 
Schleife zuruck von den Blocken 965, 975 und 985 zu 
dem Block 960 gehen, solange die Uberwachungs- 
vorrichtung aktiv bleibt. 



[0066] Wenn durch die Blocke 965, 975 und 985 

hindurch keine zu verrichtende Arbeit angetroffen 
wird, dann wird die MWAIT-Anweisung ausgefuhrt, 
wie im Block 990 angegeben. Der durch MWAIT ver- 
ursachte Thread-Suspendiert-Zustand wird schlieft- 
lich verlassen, wenn ein Break-Ereignis auftritt, wie 
im Block 995 angegeben. An diesem Punkt kehrt die 
Schleife zum Block 955 zuruck, um die Uberwa- 
chungsvorrichtung einzurichten und um danach zu 
bestimmen, ob entweder WL1 oder WL2 angeben, 
daft Arbeit zu verrichten ist. Wenn keine Arbeit zu 
verrichten ist (z.B. im Fall eines falschen Aufwecker- 
eignisses), kehrt die Schleife im Block 990 zu MWAIT 
zuruck und suspendiert den Thread wieder, bis ein 
Break-Ereignis auftritt. 

[0067] Fig. 10 zeigt eine alternative Ausfuhrungs- 
form eines Prozessors, die es ermoglicht, daft der 
Uberwachungswert in dem L1-Cache Cache-gespei- 
chert bleibt. Der Prozessor in Fig. 10 enthalt Ausfuh- 
rungseinheiten 1005, einen L1-Cache 1010 und 
Schreibkombinierpufferzwischen dem L1 -Cache und 
einem inklusiven L2-Cache 1030. Die Schreibkombi- 
nierpuffer 1020 enthalten einen Snoop-Port 1044, der 
Koharenz der internen Caches mit anderem Speicher 
uber durch eine Busschnittstelle 1040 aus einem Bus 
1045 empfangene Operationen sicherstellt. Da sich 
auf Koharenz auswirkende Transaktionen die 
Schreibkombinierpuffer 1020 uber den Snoop-Port 
1044 erreichen, kann sich eine Oberwachungsvor- 
richtung auf der Ebene des L1 -Cache befinden und 
immer noch ausreichend Informationen empfangen, 
um zu bestimmen, wann ein Speicherschreibereignis 
auf dem Bus 1 045 auftritt. Somit kann die Leitung des 
Speichers, die der Oberwachungsadresse entspricht, 
in dem L1 -Cache gehalten werden. Die Oberwa- 
chungsvorrichtung kann sowohl Schreiboperationen 
in den L1 -Cache aus den Ausfuhrungseinheiten als 
auch Schreiboperationen aus dem Bus 1045 uber 
den Snoop-Port 1044 erkennen. 

[0068] Eine weitere alternative Ausfuhrungsform 
unterstutzt eine Zweioperandenuberwachungsan- 
weisung. Ein Operand gibt wie zuvor besprochen die 
Speicheradresse an. Der zweite Operand ist eine 
Maske, die angibt, welches einer Vielfalt von Ereig- 
nissen, die ansonsten kein Break von dem Speicher- 
wartezustand bewirken wurden, ein Break von die- 
sem bestimmten Speicherwarten verursachen sollte. 
Zum Beispiel kann ein Maskenbit angeben, daft mas- 
kierte Interrupts zugelassen werden sollten, um ein 
Break des Speicherwartens zu bewirken, obwohl die 
Interrupts maskiert sind (z.B. Zulassen eines Aufwe- 
ckereignisses auch wenn das EFLAGS-Bit IF gesetzt 
ist, um Interrupts zu maskieren). Es ist anzunehmen, 
daft dann eine der Anweisungen, die nach dem 
Break des Speicherwartezustands ausgefuhrt wer- 
den, diesen Interrupt entmaskiert, so daft er versorgt 
wird. Andere Ereignisse, die ansonsten kein Break 
des Speicherwartezustands bewirken wurden, kon- 
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nen freigegeben werden, ein Break des Speicherwar- 
tens zu bewirken, Oder umgekehrt konnen Ereignis- 
se, die normalerweise ein Break des Speicherwarte- 
zustands bewirken, konnen gestort werden. Wie bei 
dem Operanden besprochen, kann der zweite Ope- 
rand explizit Oder implizit sein. 

[0069] Fig. 11 zeigt verschiedene Entwurfsrepra- 
sentationen oder -formate zur Simulation, Emulation 
und Herstellung eines Entwurfs unter Verwendung 
der offengelegten Techniken. Daten, die einen Ent- 
wurf reprasentieren, konnen den Entwurf auf vielerlei 
Weise reprasentieren. Erstens ist es in Simulationen 
nutzlich, daft die Hardware mit einer Hardwarebe- 
schreibungssprache oder einer anderen funktionalen 
Beschreibungssprache reprasentiert wird, die im we- 
sentlichen ein computerisiertes Modell dafur liefert, 
wie die entworfene Hardware erwartungsgemafi ar- 
beiten wird. Das Hardwaremodell 1110 kann in einem 
Speichermedium 1100, wie zum Beispiel einem 
Computerspeicher, gespeichert werden, so daft das 
Modell unter Verwendung von Simulationssoftware 
1120 simuliert werden kann, die eine bestimmte Pruf- 
suite 1130 auf das Hardwaremodell 1110 anwendet, 
um zu bestimmen, ob es tatsachlich wie beabsichtigt 
funktioniert. Bei bestimmten Ausfuhrungsformen wird 
die Simulationssoftware nicht aufgezeichnet, erfafct 
oder in dem Medium gehalten. 

[0070] Zusatzlich kann ein Modell auf Schaltungse- 
bene mit Logik und/oder Transistorgattern in einer 
bestimmten Phase des Entwurfsprozesses erzeugt 
werden. Dieses Modell kann ahnlich simuliert wer- 
den, und zwar manchmal durch eigene Hardwaresi- 
mulatoren, die das Modell unter Verwendung pro- 
grammierbarer Logik bilden. Diese Art von Simulati- 
on kann, wenn sie etwas weiter gefuhrt wird, eine 
Emulationstechnik sein. In jedem Fall ist unkonfigu- 
rierbare Hardware eine weitere Ausfuhrungsform, die 
ein maschinenlesbares Medium beteiligen kann, das 
ein Modell speichert, das die offengelegten Techni- 
ken verwendet. 

[0071] Aufierdem erreichen die meisten Entwurfe in 
einer bestimmten Phase eine Ebene von Werten, die 
die physikalische Plazierung verschiedener Gerate in 
dem Hardwaremodell reprasentieren. Falls her- 
kommliche Halbleiterherstellungstechniken verwen- 
det werden, konnen die das Hardwaremodell repra- 
sentierenden Daten die Daten sein, die die Anwesen- 
heit oder Abwesenheit verschiedener Merkmale auf 
verschiedenen Maskenschichten fur zur Herstellung 
der integrierten Schaltung verwendete Masken spe- 
zifizieren. Wiederum realisieren diese die integrierte 
Schaltung reprasentierenden Daten insofern die of- 
fengelegten Techniken, als die Schaltkreise oder Lo- 
gik in den Daten simuliert oder hergestellt werden, 
um diese Techniken durchzufuhren. 

[0072] Bei jeder Representation des Entwurfs kon- 



nen die Daten in jeder beliebigen Form eines compu- 
terlesbaren Mediums gespeichert werden. Eine opti- 
sche oder elektrische Welle 1160, die moduliert oder 
anderweitig erzeugt wird, um solche Informationen 
zu senden, ein Speicher1150 oder eine magnetische 
oder optische Speicherung 1140, zum Beispiel eine 
Platte, konnen das Medium sein. Die Menge von Bits, 
die den Entwurf oder den bestimmten Teil des Ent- 
wurfs beschreiben, sind ein Artikel, der an und fur 
sich von anderen zum weiteren Entwurf oder zur wei- 
teren Herstellung verkauft oder benutzt werden kann. 

[0073] Es werden also Techniken zum Suspendie- 
ren der Ausfuhrung eines Threads bis ein spezifizier- 
ter Speicherzugriff auftritt, offengelegt. Obwohl be- 
stimmte Ausfuhrungsbeispiele beschrieben und in 
den beigefugten Zeichnungen gezeigt wurden, ver- 
steht sich, daft solche Ausfuhrungsformen die allge- 
meine Erfindung lediglich veranschaulichen und nicht 
einschranken, und dali die vorliegende Erfindung 
nicht auf die spezifisch gezeigten und beschriebenen 
Konstruktionen und Anordnungen beschrankt ist, da 
Durchschnittsfachleuten bei Durchsicht der vorlie- 
genden Offenlegung verschiedene andere Modifikati- 
onen einfallen konnen. 

Zusammenfassung 

[0074] Techniken zum Suspendieren der Ausfuh- 
rung eines Threads, bis ein spezifizierter Speicherzu- 
griff auftritt. Bei einer Ausfuhrungsform enthalt ein 
Prozessor mehrere Ausfuhrungseinheiten, die meh- 
rere Threads ausfuhren konnen. Ein erster Thread 
enthalt eine Anweisung, die eine Uberwachungsa- 
dresse spezifiziert. Suspendierungslogik suspendiert 
die Ausfuhrung des ersten Threads und eine Ober- 
wachungsvorrichtung bewirkt die Wiederaufnahme 
des ersten Threads als Reaktion auf einen Zugriff auf 
die spezifizierte Gberwachungsadresse. 

Patentanspruche 

1 . Prozessor, umfassend: 

mehrere Ausfuhrungseinheiten, um die Ausfuhrung 
mehrerer Threads zu ermoglichen, einschliefclich ei- 
nes ersten Threads, wobei der erste Thread eine ers- 
te Anweisung mit einem zugeordneten Adressenope- 
randen, der eine Gberwachungsadresse angibt, auf- 
weist; 

Suspendierungslogik zum Suspendieren der Ausfuh- 
rung des ersten Threads; 

eine Oberwachungsvorrichtung zur Bewirkung der 
Wiederaufnahme des ersten Threads als Reaktion 
auf einen Speicherzugriff auf die Oberwachungsa- 
dresse. 

2. Prozessor nach Anspruch 1, wobei die Ober- 
wachungsvorrichtung die Wiederaufnahme als Reak- 
tion auf den Speicherzugriff nur dann bewirken soli, 
wenn der Speicherzugriff eine tatsachliche oder po- 
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tentielle Schreiboperation in die Oberwachungsa- 
dresse angibt. 

3. Prozessor nach Anspruch 1, wobei die Ober- 
wachungsvorrichtung die Wiederaufnahme des ers- 
ten Threads als Reaktion auf den Speicherzugriff auf 
die Oberwachungsadresse bewirken soil, wenn der 
erste Thread suspendiert wird und Oberwachungs- 
ereignisse entmaskiert werden. 

4. Prozessor nach Anspruch 3, weiterhin mit Er- 
eignisdetektionslogik, um eine Wiederaufnahme des 
ersten Threads als Reaktion auf ein von dem Spei- 
cherzugriff verschiedenes Ereignis zu bewirken. 

5. Prozessor nach Anspruch 4, wobei das Ereig- 
nis ein Interrupt ist. 

6. Prozessor nach Anspruch 1, wobei der zuge- 
ordnete Adressenoperand ein impliziter Operand ist. 

7. Prozessor nach Anspruch 6, wobei der zuge- 
ondnete Adressenoperand in einem vorbestirnmten 
Register gespeichert wird. 

8. Prozessor nach Anspruch 1, wobei die Sus- 
pendierungslogik die Ausfuhrung des ersten Threads 
als Reaktion auf eine zweite Anweisung suspendie- 
ren soli, wobei die erste Anweisung die Oberwa- 
chungsvorrichtung freigibt und die zweite Anweisung 
durch die Oberwachungsvorrichtung signalisierte Er- 
eignisse entmaskiert. 

9. Prozessor nach Anspruch 8, wobei die zweite 
Anweisung die Oberwachungsvorrichtung nur dann 
freigibt, wenn die erste Anweisung ausgefuhrt wurde. 

10. Prozessor nach Anspruch 1, wobei die Sus- 
pendierungslogikdie Ausfuhrung des ersten Threads 
als Reaktion auf die erste Anweisung suspendieren 
soil. 

1 1 . Prozessor nach Anspruch 8, weiterhin umfas- 
send: Koharenzlogik zur Verbesserung der Visibilitat 
von Speicheroperationen in die Oberwachungsa- 
dresse. 

12. Prozessor nach Anspruch 11, wobei die Ko- 
harenzlogik sicherstellen soil, daft kein Cache in ei- 
nem Koharenzbereich Informationen an der uber- 
wachten Adresse in einem Modifiziert- Oder Exklu- 
siv-Zustand speichert. 

13. Prozessor nach Anspruch 12, wobei die Ko- 
harenzlogik eine der uberwachten Adresse zugeord- 
nete Cache-Leitung aus etwaigen internen Caches 
ausraumen und eine Busleseleitungstransaktion der 
der Oberwachungsadresse zugeordneten Ca- 
che-Leitung zu anderen an den Prozessor angekop- 
pelten Prozessoren erzeugen soli, wobei die Busle- 



seleitungstransaktion eine Mehrphasentransaktion 
ist, die gemaft einem Pipeline-Busprotokoll bereitge- 
stellt wird. 

14. Prozessor nach Anspruch 11, wobei die Ko- 
harenzlogik bewirken soli, daft der Prozessor einen 
Buszyklus erzeugt, um zu verhindern, daft etwaige 
andere Busagenten eine Schreibtransaktion zu der 
Oberwachungsadresse durchfuhren, ohne die 
Schreibtransaktion rund zu senden. 

15. Prozessor nach Anspruch 14, weiterhin mit 
Bussteuerlogik zum Setzen eines Treffersignals als 
Reaktion darauf, daft ein anderer Busagent Informa- 
tionen an der Oberwachungsadresse liest. 

16. Prozessor nach Anspruch 1 , wobei die durch 
den zugeordneten Adressenoperanden angegebene 
Oberwachungsadresse eine Cache-Leitung, einen 
Teil einer Cache-Leitung oder eine alternativ bemes- 
sene Einheit fur Daten an einer durch den zugeord- 
neten Adressenoperanden angegebenen Adresse 
angibt. 

17. Prozessor nach Anspruch 1, weiterhin mit 
Adressenubersetzungslogik zum Obersetzen des zu- 
geordneten Adressenoperanden in die Oberwa- 
chungsadresse, die eine physikalische Adresse ist. 

18. Prozessor nach Anspruch 1, wobei die Ober- 
wachungsadresse aus derfolgenden Menge gewahlt 
wird: eine physikalische Adresse, eine virtuelle 
Adresse, eine relative Adresse und eine lineare 
Adresse. 

19. Prozessor nach Anspruch 1, weiterhin mit 
mehreren partitionierbaren Betriebsmitteln, die parti- 
tioniert werden sollen, um einen Teil jedes partitio- 
nierbaren Betriebsmittels jedem aktiven der mehre- 
ren Threads fest zuzuordnen, wenn mehrere 
Threads aktiv sind, wobei die Suspendierungslogik 
etwaige der mehreren dem ersten Thread fest zuge- 
ordneten Partitionen als Reaktion auf das Suspen- 
dieren der AusfGhrung des ersten Threads freigeben 
soil. 

20. Prozessor nach Anspruch 19, wobei die 
Oberwachungsvorrichtung bewirken soil, daft die 
mehreren partitionierbaren Betriebsmittel umpartitio- 
niert werden, um die Ausfuhrung des ersten Threads 
als Reaktion auf den Speicherzugriff auf die Oberwa- 
chungsadresse zu ermoglichen. 

21 . Prozessor nach Anspruch 20, wobei die meh- 
reren partitionierbaren Betriebsmittel folgendes um- 
fassen: 

eine Anweisungsschlange; 
einen Umordnungspuffer; 
ein Registerpool; 
mehrere Speicherpuffer. 
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22. Prozessor nach Anspruch 21, weiterhin um- 
fassend; 

mehrere duplizierte Betriebsmittel, wobei die mehre- 
ren duplizierten Betriebsmittel fur jeden der mehreren 
Threads dupliziert werden, wobei die mehreren dup- 
lizierten Betriebsmittel folgendes umfassen: 
mehrere Prozessorzustandsvariablen; 
einen Anweisungszeiger; 
Registerumbenennungslogik. 

23. Prozessor nach Anspruch 22, weiterhin um- 
fassend: 

mehrere gemeinsam benutzte Betriebsmittel, wobei 
die mehreren gemeinsam benutzten Betriebsmittel 
zur Verwendung durch beliebige der mehreren 
Threads verfugbar sind, wobei die mehreren gemein- 
sam benutzten Betriebsmittel folgendes umfassen: 
die mehreren Ausfuhrungseinheiten; 
einen Cache; 
einen Scheduler. 

24. Prozessor, umfassend: 

ein Frontend zum Empfangen einer ersten Anwei- 
sung aus einem ersten Thread und einer zweiten An- 
weisung aus dem ersten Thread, wobei die erste An- 
weisung eine Oberwachungsadresse angibt; 
Ausfuhrungsbetriebsmittel zum Ausfuhren der ersten 
Anweisung und der zweiten Anweisung und zum 
Suspendieren der Ausfuhrung des ersten Threads 
als Reaktion auf die zweite Anweisung; 
eine Oberwachungsvorrichtung zur Bewirkung der 
Wiederaufnahme des ersten Threads als Reaktion 
auf einen Speicherzugriff auf die Uberwachungsa- 
dresse. 

25. Prozessor nach Anspruch 24, wobei die erste 
Anweisung einen Operanden aufweist, der eine line- 
are Adresse angibt, und wobei der Prozessor weiter- 
hin Adresseubersetzungslogik zum Obersetzen der 
linearen Adresse umfa&t, um die Uberwachungsa- 
dresse zu erhalten, die eine physikalische Adresse 
ist. 

26. Prozessor nach Anspruch 25, weiterhin um- 
fassend: Koharenzlogik, um sicherzustellen, dali 
kein Cache in einem anderen Prozessor, der an den 
Prozessor angekoppelt ist, Informationen an der 
Uberwachungsadresse in einem Modifiziert- Oder Ex- 
klusiv-Zustand speichert. 

27. Prozessor nach Anspruch 26, wobei die Ko- 
harenzlogik als Reaktion auf ein Snooping der Ober- 
wachungsadresse durch einen anderen Prozessor 
ein Treffersignal setzen soli. 

28. Prozessor, umfassend: 

Frontendlogik zum Empfangen einer ersten Anwei- 
sung aus einem ersten Thread, wobei die erste An- 
weisung eine zugeordnete Oberwachungsadresse 
aufweist; 



eine Oberwachungsvorrichtung, die so gekoppelt ist, 
daft sie die Oberwachungsadresse empfangt und als 
Reaktion auf die erste Anweisung Speicherzugriffe 
auf die Oberwachungsadresse iiberwacht und ein Er- 
eignis signalisiert, wenn eine Zugriff auf die Oberwa- 
chungsadresse auftritt. 

29. Prozessor nach Anspruch 28, wobei die 
Oberwachungsvorrichtung das Ereignis als Reaktion 
auf einen Schreibspeicherzugriff, der in die Oberwa- 
chungsadresse schreibt, signalisieren soil. 

30. Prozessor nach Anspruch 28, wobei die 
Oberwachungsvorrichtung das Ereignis als Reaktion 
auf eine Leitungsinvalidierungstransaktion signalisie- 
ren soil. 

31. Prozessor nach Anspruch 28, weiterhin um- 
fassend: Koharenzlogik, um sicherzustellen, daft 
kein Cache in einem anderen Prozessor, der an den 
Prozessor angekoppelt ist, Informationen an der 
Oberwachungsadresse in einem Modifiziert- oder Ex- 
klusiv-Zustand speichert. 

32. Prozessor nach Anspruch 31, wobei die Ko- 
harenzlogik Logik zu Erzeugung eines internen Ca- 
che-Ausraumzyklus und zur Erzeugung einer exter- 
nen Leseleitungstransaktion umfafct. 

33. Prozessor nach Anspruch 28, weiterhin um- 
fassend: Logik zum Entmaskieren von Oberwa- 
chungsereignissen aus der Oberwachungsvorrich- 
tung und zum Suspendieren des ersten Threads als 
Reaktion auf eine zweite Anweisung. 

34. Prozessor, umfassend: 

mehrere Ausfuhrungseinheiten zur Ausfuhrung meh- 
rerer Threads; 

Frontendlogik zum Empfangen einer Anweisung aus 
einem ersten Thread der mehreren Threads; 
Suspendierungslogik zum Suspendieren des ersten 
Threads als Reaktion auf die Anweisung, wenn keine 
Oberwachungsereignisse anstehen, und zum Zulas- 
sen der Ausfuhrung anderer der mehreren Threads. 

35. Prozessor nach Anspruch 34, wobei die Sus- 
pendierungslogik die Erkennung von Oberwachungs- 
ereignissen, einschliefclich bereits anstehender 
Oberwachungsereignisse, freigeben soli. 

36. Prozessor nach Anspruch 35, wobei der Pro- 
zessor mehrere partitionierbare Betriebsmittel um- 
fafit und wobei die Suspendierungslogik Partitionen 
jedes der mehreren partitionierbaren Betriebsmittel, 
die dem ersten Thread zugeordnet sind, zusatzlich zu 
den Suspendierem des ersten Threads als Reaktion 
auf die Anweisung freigeben soil. 

37. Prozessor, umfassend: 

mehrere Thread-partitionierbare Betriebsmittel zum 
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Empfangen von Anweisungen; 

mehrere gemeinsam benutzte Betriebsmittel zur 
Ausfuhrung von Anweisungen in Zusammenarbeit 
mit den mehreren Thread-partitionierbaren Betriebs- 
mitteln; 

Thread-Suspendierungslogik zum Suspendieren ei- 
nes ersten Threads als Reaktion auf eine Anweisung 
in dem ersten Thread, wobei die Thread-Suspendie- 
rungslogik Partitionen der mehreren Thread-partitio- 
nierbaren Betriebsmittel, die dem ersten Thread zu- 
geordnet sind, als Reaktion auf das Suspendieren 
des ersten Threads freigeben soil; 
eine Uberwachungsvorrichtung zum Bewirken, daft 
als Reaktion auf einen Zugriff auf eine durch den ers- 
ten Thread angegebene Speicheradresse der Pro- 
zessor die mehreren Thread-partitionierbaren Be- 
triebsmittel neu partitioniert und die Ausfuhrung des 
ersten Threads wiederaufnimmt. 

38. Prozessor nach Anspruch 37, wobei der Zu- 
griff auf die Speicheradresse durch eine erste Anwei- 
sung spezifiziert wird, die in dem ersten Thread aus- 
gefuhrt wird, und wobei die Oberwachungsvorrich- 
tung entmaskiert wird, um Oberwachungsereignisse 
zu signalisieren, um eine Thread-Wiederaufnahme 
durch die Anweisung zu bewirken, woraufhin die 
Thread-Suspendierungslogik den ersten Thread sus- 
pendieren soil. 

39. Vorrichtung, umfassend: 

Mittel zum Suspendieren eines ersten Threads von 

mehreren Ausfuhrungsthreads; 

Mittel zum Erkennen eines Zugriffs auf eine Spei- 

cherstelle; 

Mittel zum Wiederaufnehmen des ersten Threads als 
Reaktion darauf, daft das Mittel zum Erkennen den 
Zugriff auf die Speicherstelle erkennt. 

40. Vorrichtung nach Anspruch 39, wobei das 
Mittel zum Erkennen des Zugriffs auf die Speicher- 
stelle als Reaktion auf eine in dem ersten Thread 
ausgefuhrte erste Anweisung freigegeben wird und 
wobei das Mittel zum Suspendieren des ersten 
Threads den ersten Thread als Reaktion auf eine in 
dem ersten Thread ausgefuhrte zweite Anweisung 
suspendiert. 

41 . Vorrichtung nach Anspruch 40, weiterhin um- 
fassend: ein Koharenzmittel zum Vereinfachen der 
Erkennung des Zugriffs auf die Speicherstelle. 

42. Vorrichtung nach Anspruch 41 , wobei der Zu- 
griff auf die Speicherstelle ein Schreib- oder ein Inva- 
lidierungszugriff ist 

43. Vorrichtung nach Anspruch 41, weiterhin um- 
fassend: 

ein Mittel zum Verschmelzen von Betriebsmitteln als 
Reaktion darauf, daft das Mittel zum Suspendieren 
die Ausfuhrung des ersten Threads suspendiert, wo- 
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bei das Mittel zum Verschmelzen dem ersten Thread 
zugeordnete partitionierte Betriebsmittel zur Verwen- 
dung durch andere der mehreren Threads befreit; 
ein Mittel zum Partitionieren von Betriebsmitteln zum 
Umpartitionieren von Betriebsmitteln, um die Wieder- 
aufnahme des ersten Threads zu ermoglichen. 

44. Verfahren mit den folgenden Schritten: 
Empfangen eines ersten Opcodes in einem ersten 
Ausfuhrungsthread, wobei der erste Opcode einen 
zugeordneten Adressenoperandeh aufweist, der eine 
Uberwachungsadresse angibt; 

Suspendieren des ersten Threads; 
Erkennen eines Speicherzugriffs auf die Uberwa- 
chungsadresse; 

Wiederaufnehmen des ersten Threads als Reaktion 
auf das Erkennen des Speicherzugriffs auf die Ober- 
wachungsadresse. 

45. Verfahren nach Anspruch 44, wobei das Sus- 
pendieren des ersten Threads die folgenden Schritte 
umfaftt: 

Empfangen einer zweiten Anweisung in dem ersten 
Thread; 

Suspendieren des ersten Threads als Reaktion auf 
die zweite Anweisung. 

46. Verfahren nach Anspruch 45, wobei der Spei- 
cherzugriff ein Schreibzugriff ist. 

47. Verfahren nach Anspruch 45, weiterhin mit 
dem Schritt des Ubersetzens des zugeordneten 
Adressenoperandens in eine uberwachte physikali- 
sche Adresse, wobei das Erkennen des Speicherzu- 
griffs auf die Oberwachungsadresse das Erkennen 
eines Schreibzugriffs aus die uberwachte physikali- 
sche Adresse umfaftt. 

48. Verfahren nach Anspruch 44, weiterhin mit 
dem folgenden Schritt: Verhindern, daft andere 
Agenten die Eigentumerschaft von an der Oberwa- 
chungsadresse gespeicherten Informationen erhal- 
ten. 

49. Verfahren nach Anspruch 44, wobei das Er- 
kennen die folgende Schritte umfaftt: 
Empfangen von Zyklusinformationen von externen 
Bustransaktionen ; 

Erkennen von Schreiboperationen in die Uberwa- 
chungsadresse 

50. Verfahren nach Anspruch 44, weiterhin mit 
dem folgenden Schritt: Wiederaufnehmen des ersten 
Threads als Reaktion auf ein von dem Speicherzu- 
griff auf die Uberwachungsadresse verschiedenes 
Ereignis. 

51. Verfahren nach Anspruch 50, wobei das Er- 
eignis ein Interrupt ist. 
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52. Verfahren nach Anspruch 51 , wobei der Inter- 
rupt ein maskierter Interrupt ist, der durch einen zwei- 
ten Operanden angegeben wird, um dennoch als ein 
Break-Ereignis betrachtet zu werden. 

53. Verfahren mit den folgenden Schritten: 
Empfangen eines ersten Opcodes, der in einem ers- 
ten Ausfuhrungsthread ausgefuhrt wird; 
Obersetzen einer dem ersten Opcode zugeordneten 
linearen Adresse in eine physikalische Adresse; 
Ausfuhren einer Bustransaktion durch einen uberwa- 
chenden Busagenten, um sicherzustellen, da(i kein 
anderer Busagent ausreichende Eigentumerschaft 
von der physikalischen Adresse zugeordneten Daten 
besitzt, um es einem anderen Busagenten zu erlau- 
ben, Daten zu modifizieren, ohne den uberwachen- 
den Busagenten zu informieren; 

Oberwachen auf einen SchreibzugrifFauf die physika- 
lische Adresse; 

Signalisieren eines Treffers, wenn ein anderer Busa- 
gent die physikalische Adresse liest; 
Empfangen eines zweiten Opcodes in dem ersten 
Ausfuhrungsthreads; 

Suspendieren des ersten Ausfuhrungsthreads und 
Freigeben des Erkennens eines Oberwachungs- 
ereignisses als Reaktion auf den zweiten Opcode; 
Wiederaufnehmen des ersten Threads, wenn ein 
Schreibzugriff auftritt; 

Wiederaufnehmen des Ausfuhrens des ersten 
Threads als Reaktion auf ein beliebiges einer ersten 
Mengevon Ereignissen; 

Ignorieren einer zweiten Menge von Ereignissen. 

54. Verfahren nach Anspruch 53, wobei das Sus- 
pendieren des ersten Ausfuhrungsthreads als Reak- 
tion auf den zweiten Opcode die folgenden Schritte 
umfafct: 

Prufen, ob das Oberwachungsereignis ansteht; 
Prufen, ob eine Oberwachungsvorrichtung aktiv ist; 
wenn die Oberwachungsvorrichtung aktiv ist und kein 
Oberwachungsereignis ansteht, Eintreten in einen 
Erster-Thread-Suspendiert-Zustand . 

55. Verfahren nach Anspruch 54, wobei der Ein- 
tritt in den Erster-Thread-Suspendiert-Zustand die 
folgenden Schritte umfaftt: 

Freigeben mehrerer Register in einem Registerpool; 
Freigeben mehrerer Anweisungswarteschlangenein- 
trage in einer Anweisungswarteschlange; 
Freigeben mehrerer Speicherpuffereintrage in einem 
Speicherpuffer; 

Freigeben mehrerer Umordnungspuffereintrage in ei- 
nem Umordnungspuffer. 

56. System, umfassend; 

einen Speicher zum Speichern einer ersten Anwei- 
sung auf einem ersten Thread, wobei die erste An- 
weisung einen zugeordneten Adressenoperanden 
aufweist, der eine Oberwachungsadresse angibt; 
einen an dem Speicher angekoppelten ersten Pro- 



zessor, wobei der erste Prozessor einer Oberwa- 
chungsvorrichtung ermoglichen soil, Speichertrans- 
aktionen zu uberwachen, um als Reaktion auf die 
erste Anweisung einen Speicherzugriff auf die Ober- 
wachungsadresse zu erkennen und als Reaktion auf 
den Speicherzugriff auf die Oberwachungsadresse 
die Wiederaufnahme des ersten Threads zu bewir- 
ken. 

57. System nach Anspruch 56, wobei der Spei- 
cher eine zweite Anweisung aus dem ersten Thread 
speichern soil und wobei der erste Prozessor den 
ersten Thread als Reaktion auf die zweite Anweisung 
suspendieren soli. 

58. System nach Anspruch 57, wobei die Ober- 
wachungsvorrichtung als Reaktion auf das Auftreten 
des Speicherzugriffs einen Anstehendes-Oberwa- 
chungsereignis-Anzeiger setzen soli, wobei der An- 
stehendes-Oberwachungsereignis-Anzeiger bewir- 
ken soil, dafc der erste Prozessor einen Thread wie- 
deraufnimmt, nachdem er durch die zweite Anwei- 
sung entmaskiert wurde. 

59. System nach Anspruch 56, wobei der erste 
Prozessor einen ersten Cache enthalt, wobei das 
System weiterhin folgendes umfafct: einen zweiten 
Prozessor mit einem zweiten Cache, wobei der erste 
Prozessor eine Bustransaktion zu dem zweiten Pro- 
zessor steuert, um den zweiten Prozessor dazu zu 
zwingen, etwaige Transaktionen, die eine Verande- 
rung von an der Oberwachungsadresse in dem zwei- 
ten Cache gespeicherten Daten ermoglichen, zu dem 
ersten Prozessor rund zu senden. 

60. System nach Anspruch 59, wobei der erste 
Prozessor ein Signal setzen soli, das verhindert, daft 
der zweite Prozessor Daten an der Oberwachungsa- 
dresse in einen Zustand Cache-speichert, der es 
dem zweiten Prozessor ermoglichen wiirde, an der 
Oberwachungsadresse in dem zweiten Cache ge- 
speicherte Daten zu modifizieren, ohne rund zu sen- 
den, dad eine Modifikation stattfindet. 

61. System nach Anspruch 60, wobei das Signal 
einen Cache-Treffer angibt und verhindert, dad der 
zweite Cache Daten an der Oberwachungsadresse in 
einen Exklusiv-Zustand speichert. 

62. System nach Anspruch 58, wobei der erste 
Prozessor weiterhin den ersten Thread wiederauf- 
nehmen soil, wenn ein alternatives Ereignis auftritt. 

63. System nach Anspruch 62, wobei das alter- 
native Ereignis ein Interrupt ist. 

64. System nach Anspruch 62, wobei der in dem 
Speicher gespeicherte erste Thread eine Schleife 
enthalt, wobei die Schleife die erste Anweisung und 
die zweite Anweisung sowie eine Prufung enthalt, um 
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zu bestimmen, ob sich Daten an der Oberwachungs- 
adresse verandert haben, und um die Schleife neu zu 
starten, wenn Daten an der Oberwachungsadresse 
unverandert bleiben. 

65. Artikel mit einem computerlesbaren Medium, 
das einen Prozessor re prase ntiert, umfassend: 
mehrere Ausfuhrungseinheiten, um die Ausfuhrung 
mehrerer Threads zu ermdglichen, einschliefclich ei- 
nes ersten Threads, wobei der erste Thread eine ers- 
te Anweisung mit einem zugeordneten Adressenope- 
randen, der eine Uberwachungsadresse angibt, auf- 
weist; 

Suspendierungslogik zum Suspendieren der Ausfuh- 
rung des ersten Threads; eine Oberwachungsvor- 
richtung zur Bewirkung der Wiederaufnahme des 
ersten Threads als Reaktion auf einen Speicherzu- 
griff auf die Oberwachungsadresse. 

66. Artikel nach Anspruch 65, wobei die Uberwa- 
chungsvorrichtung die Wiederaufnahme als Reaktion 
auf den Speicherzugriff nur dann bewirken soil, wenn 
der Speicherzugriff eine tatsachliche Oder potentielle 
Schreiboperation in die Oberwachungsadresse an- 
gibt. 

67. Artikel nach Anspruch 65, wobei die Uberwa- 
chungsvorrichtung die Wiederaufnahme des ersten 
Threads als Reaktion auf den Speicherzugriff auf die 
Oberwachungsadresse bewirken soil, wenn der erste 
Thread suspendiert wird und Oberwachungsereignis- 
se entmaskiert werden. 

68. Artikel nach Anspruch 65, wobei der Prozes- 
sor weiterhin Ereignisdetektionslogik umfalM, um die 
Wiederaufnahme des ersten Threads als Reaktion 
auf ein von dem Speicherzugriff verschiedenes Er- 
eignis zu bewirken. 

69. Artikel nach Anspruch 68, wobei der Prozes- 
sor weiterhin mehrere partitionierbare Betriebsmittel 
umfafct, die partitioniert werden sollen, um einen Teil 
jedes partitionierbaren Betriebsmittels jedem aktiven 
der mehreren Threads fest zuzuordnen, wenn meh- 
rere Threads aktiv sind, wobei die Suspendierungslo- 
gik alle dem ersten Thread fest zugeordneten Partiti- 
onen als Reaktion auf das Suspendieren der Ausfuh- 
rung des ersten Threads freigeben soil. 

Es folgen 1 3 Blatt Zeichnungen 
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